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摘 要 : 溶解 氧 (DO) 浓度 是 对 是 养殖 水 质 检测 的 核心 指标 。 为 提高 对 是 养殖 溶解 氧 浓度 的 预测 精度 ， 本 
研究 提出 了 一 种 基于 经 验 模 态 分 解 、 随 机 森林 和 长 短 时 记忆 神经 网 络 (EMD-RF-LSTM) 的 对 是 养殖 溶解 氧 
浓度 组 合 预 测 模 型 。 首 先 采 用 经 验 模 态 分 解 EMD) 对 养殖 水 质 溶解 氧 浓度 时 序数 据 进 行 多 尺度 特征 提取 ， 
得 到 不 同 尺度 下 的 固有 模 态 分 量 OMF); 然后 分 别 采 用 长 短 时 记忆 神经 网 络 (LSTM) 和 随机 森林 (RF) 对 
高 、 低 频 不 同 尺度 IMF 进行 建 模 ; 最 后 结合 各 分 量 预测 结果 构建 到 加 模型 ， 实 现 对 溶解 氧 浓度 时 序数 据 的 综 
合 预 测 。 本 研究 模型 在 广东 省 湛江 市 南 三 岛 对 虾 养殖 基地 展开 了 试验 及 应 用 ， 在 基于 真实 数据 集 的 性 能 测 
试 中 ， 经 验 模 态 分 解 后 EMD-ELM 模型 与 极限 学 习 机 (ELM) 模型 对 比 ， 平均 绝对 误差 (MAPE)、 均 方 根 误 
% (RMSE) 和 平均 绝对 误差 (MAE) 分 别 降 低 了 30.11%、29.60% 和 32.95%。 在 经 验 模 态 分 解 基础 上 用 REF 
和 LSTM 对 不 同 特征 尺度 的 本 征 模 态 分 量 分 别 预测 后 释 加 求 和 ，EMD-RF-LSTM 模 型 预测 的 精度 指标 MAPE、 
RMSE Ail MAE 4Y 53] A 0.0129, 0.1156 和 0.0844， 其 中 关键 指标 MAPE $ EMD-ELM, EMD-RF 和 EMD-LSTM 
分 别 降低 了 84.07%、57.57% 和 49.81%， 预 测 精 度 显著 提高 。 结 果 表 明 ， 本 研究 针对 经 验 模 态 分 解 后 高 、 低 
频 分 量 分 别 预测 的 策略 可 有 效 提升 综合 性 能 ， 表 明 本 研究 模型 具有 和 较 高 的 预测 精度 ， 能 够 较 准确 地 实现 对 
是 养殖 水 体 中 溶解 氧 浓度 预测 。 
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1 引言 


溶解 氧 (Dissolved Oxygen, DO) 浓度 是 养 
殖 水 质 检测 的 核心 指标 ， 影 响 着 水 产生 物 的 生长 
速度 和 成 活 率 ， 是 决定 对 是 品质 及 产量 的 重要 因 
A Y. 目前 ， 中 国 典 型 南美 白 是 的 平均 养殖 密 
度 达 到 220 一 300 尾 /m*?， 养 殖 周 期 为 2 一 3 期 。 由 
于 虾 塘 养 殖 密度 远 高 于 鱼 塘 养 殖 密度 ， 接 近 工 厂 
鱼 养殖 密度 ， 对 于 溶解 氧 浓 度 的 监控 要 求 更 高 。 
构建 对 是 养殖 环境 水 体 溶解 氧 变化 模型 ， 精 准 预 
测 水 体 溶 解 氧 浓度 变化 ”法 ， 对 于 实现 对 是 精细 
化 养殖 管理 和 调控 ， 科 学 决策 养殖 密度 和 饲料 配 
比 ， 确 保 对 虾 在 无 应 激 环境 下 健康 生长 、 提 高 养 
殖 效 益 具 有 重要 意义 “。 

目前 在 水 产 养 殖 领域 已 有 部 分 团队 广泛 开展 
溶解 氧 浓 度 预 测 方法 研究 。Liu 等 “采用 小 波 分 
r (Wavelet Analysis，WA) 、 柯 西 粒子 群 优 化 最 
小 二 乘 支 持 向 量 回 归 机 的 溶解 氧 浓度 预测 模型 ， 
并 应 用 于 河 角 养殖 DO 预测 ; RERE "采用 小 
波 分 析 进 行 多 尺度 特征 提取 ， 通 过 加 权 最 小 二 乘 
支持 向 量 回归 机 对 不 同 尺度 序列 分 别 建 模 ， 实 现 
DO 预测 ; Huan 等 “采用 梯度 增强 决策 树 和 长 短 
时 记忆 网 络 (Long Short-Term Memory, LSTM) 
对 水 产 养 殖 溶 解 氧 浓度 进行 了 预测 ; 朱 南 阳 等 
优化 LSTM 反 问 传播 时 的 损失 函数 ， 提 出 了 提高 
低 溶解 氧 含 量 估算 精度 的 溶解 氧 预 测 模 型 
(LDO-LSTM) ,不 但 可 以 保证 整体 溶 氧 预测 精 
度 ， 且 能 提高 较 低 溶 解 氧 浓度 值 的 估算 精度 。 

在 前 期 研究 中 ， 有 研究 者 认为 对 虾 养殖 水 体 
溶解 氧 具 有 长 时 序 、 不 稳定 、 多 尺度 非 线 性 等 特 
KOS 且 受 多 因素 复杂 耦合 关系 影响 |); 难 以 
建立 高 性 能 泛 化 模型 ”。 由 于 感知 设备 失 能 、 
噪声 干扰 和 长 时 序数 据 中 ， 以 及 监测 点 时 空 分 
布 差异 "等 问题 ,需要 对 对 是 养殖 水 体 溶 解 氧 
时 序数 据 进行 降 噪 、 多 尺度 分 析 、 时 空 分 类 及 特 
征 提 取 等 预 处 理 "。 小 波 分 析 曾 被 用 于 数据 降 
噪 和 特征 提取 ， 但 需 预定 基 苑 数 ， 并 存在 人 为 因 
RPP, AWA AYA (Empirical Mode De- 
composition, EMD) 可 将 非 平稳 时 序数 据 多 尺 


JE AY ft BOAR ASG EAS 4D E (Intrinsic mode func- 
tion，IMF) ， 能 有 效 进 行 数 据 降 噪 和 抗 干扰 预 
处 理 ”1。 

目前 ，EMD 在 水 产 养殖 等 领域 得 到 了 应 用 。 
te Je E&P EMD 和 极限 学 习 机 (Extreme 
Learning Machine, ELM) 结合 ， 构 建 了 基于 
EMD-ELM 的 水 温 组 合 预测 模型 。 施 珠 等 2 在 
EES ”研究 结果 基础 上 ， 结 合 改进 遗传 算 
法 (Improved Genetic Algorithm, IGA) 和 改进 
极限 学 习 机 (improved Extreme Learning Ma- 
chine，SELM) 构建 了 基于 EMD-IGA-SELM 的 
预测 模型 ， 以 提高 水 体温 度 预 测 的 精度 和 稳定 
性 。 杨 亮 等 2 提出 了 基于 EMD-LSTM 的 预测 模 
型 ， 将 氮气 浓度 时 间 序 列 数据 进行 EMD 处 理 ， 
生成 不 同时 间 尺 度 下 的 模 态 分 量 ， 然 后 使 用 
LSTM 对 各 分 量 分 别 预测 ， 再 相 加 以 实现 氮气 浓 
度 的 组 合 模型 。 戴 邵武 等 “提出 LSTM 在 传统 
神经 网 络 基础 上 增加 隐藏 层 ， 有 效 避 人 免 了 梯度 消 
失 和 爆炸 ， 具 有 和 较 好 的 预测 精度 和 和 鲁 棒 性 ;， 赵 晓 
东 等 3 在 对 基于 频 域 分 解 和 深度 学 习 算 法 的 预 
测 模 型 研究 中 发 现 ，LSTM 在 高 频 分 量 预测 的 效 
果 上 表现 优异 ， 而 在 训练 样本 较 少 的 低频 分 量 预 
测 上 效果 不 佳 。 秦 嘉文 等 ” 利用 经 验 模 态 分 解 
与 随机 森林 构建 的 EMD-RF 模 型 ， 在 不 同 频 度 分 
量 上 获得 了 较 高 的 精度 和 泛 化 性 能 。 

由 以 上 研究 可 知 ，EMD 分 解 和 LSTM 组合 
模型 已 用 于 溶解 氧 浓 度 预 测 ， 但 在 训练 样本 较 少 
的 低频 分 量 预测 上 效果 不 佳 的 问题 有 待 解决 ， 针 
对 不 同 频 域 选 择 合适 预测 模型 的 组 合 预测 方法 还 
有 待 进一步 研究 。 为 了 解决 训练 样本 较 少时 非 线 
性 时 序列 数据 经 验 模 态 分 解 后 不 同 频 域 模 态 分 量 
预测 精度 不 佳 的 问题 ， 本 研究 结合 经 验 模 态 分 
解 、 随 机 森林 和 长 短 时 记忆 神经 网 络 提出 了 一 种 
基于 EMD-RF-LSTM 的 对 是 养殖 溶解 氧 非 线性 组 
合 预测 模型 ， 通 过 EMD 将 养殖 浴 解 氧 时 序数 据 
进行 多 尺度 分 解 ， 获 得 不 同 特征 尺度 的 本 征 模 态 
分 量 和 残余 分 量 ， 结 合 各 分 量 预 测 结 果 ， 选 择 
RF 和 LSTM 分 别 对 低频 分 量 、 高 频 分 量 和 残 差 
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进行 建 模 预 测 ， 最 后 将 各 预测 结果 又 加 求 和 ， 实 
现 对 虾 养殖 水 体 溶解 氧 浓 度 预 测 。 


2 数据 与 方法 


2.1 研究 数据 


为 评估 本 研究 模型 在 真实 环境 下 的 表现 ， 本 
研究 在 广东 省 湛江 市 南 三 岛 对 是 养殖 基地 开展 ， 
采集 对 虾 养殖 池塘 真实 数据 。 试 验 用 对 虾 养殖 池 
塘 为 长 38.0 m、 宽 32.0 m、 水 深 1.1 m， 在 池塘 
内 多 点 部 署 了 多 参数 水 质 传感器 、 增 氧 机 、 循 环 
泵 等 水 质 监控 设备 。 对 是 养殖 池塘 监测 平面 示意 
图 及 试验 平台 拓扑 结构 图 如 图 1 所 示 。 

对 是 养殖 环境 监控 及 试验 平台 包括 数据 采 
集 、 无 线 传输 、 数 据 处 理 、 智 能 监控 等 功能 。 其 
中 基于 物 联 网 的 数据 采集 模块 采集 的 对 虾 养殖 水 


ke -38m qg 
进 水 | ia 
加 OQ =e o- 
p 。 © = 
© =e © = i 
排水 


pe 


WV. 
ree Owe ae krama 
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注 :主要 传感器 包括 水 下 摄像 头 PHR RE REPRE KR 
传感器 、 电 导 率 传感器 \ 溶 解 气 传感器、 雨量 传感器 气压 传 感 
器 、 风 速 风向 、 太 阳 辐 射 温 度 传感器 、 湿 度 传感器 
(b) 试 验 平台 拓扑 结构 图 
图 1 对 是 养殖 环境 物 联 网 监控 及 试验 平台 
Fig.1 Internet of things monitoring and experimental plat- 


form for shrimp culture environment 


质 参数 数据 包括 溶解 氧 、pH 值 、 水 温 、 电 导 率 
和 省 度 等 ， 采 集 频率 为 30 min. 


2.2 研究 方法 


2.2.1 经 验 模 态 分 解 (EMD ) 

EMD 是 一 种 自 适 应 信号 时 频 处 理 方 法  ， 
规避 预先 设置 基 范 数 等 人 为 因素 影响 ,能够 将 非 
平稳 非 线 性 原始 信号 进行 自 适应 多 尺度 分 解 ， 获 
得 一 组 平稳 性 和 周期 性 特征 的 本 征 IMF 和 残余 分 
量 RES 2 。 将 对 是 养殖 水 体 溶解 氧 原始 时 序数 
据 记 为 X (t), WEMD 步骤 如 下 。 

(1) 通过 三 次 样 条 插值 法 ， 拟 合 得 到 溶解 氧 
原始 时 序数 据 信 号 的 上 下 包 络 线 ， 计 算 局 部 极 大 
fh XO Bb 1h Xa 及 均值 MD， 如 
公式 (1)。 


Xant) $ Kal t) 


M(t)= 5 (1) 
(2) 计算 XD 与 M(D) 之 差 HH)， 如 公式 (2): 
H(t)=X(t)- M(t) (2) 


若 瑟 (0 符合 本 征 模 态 分 量 的 要 求 ， 则 增加 为 
初始 的 IMEF 分 量 ， 记 作 CI(D; 如 不 符合 ， 则 作为 
和 0 重复 以 上 步骤， 直至 成 为 一 个 新 增 IMEF 分 量 ， 
最 终 构 成 信号 序列 的 高 频 分 量 ; 

(3) 在 玖 0 中 减 去 CO 可 得 到 残 差 项 六 (1), 
并 将 其 作为 新 的 信号 序列 ， 用 (2) 中 方法 得 到 
其 余 IMF 分 量 C), CA, COMA rio 
原始 时 序 X(D) 最 终 可 分 解 表 示 为 各 组 分 量 和 残余 
Mr OŽA, WAR (3)。 

x(1)= C(t) + r(t) (3) 
2.2.2 ”随机 森林 

随机 森林 (Random Forest, RF) 是 一 种 继 
承 自 举 集 成 (Bootstrap Aggregation, Bagging) 
算法 思想 的 机 器 学 习 方 法 下， 使 用 分 类 与 回归 
决策 树 作为 弱 学 习 器 ， 通 过 多 个 互相 独立 且 权 重 
相同 的 决策 树 组 成 决策 森林 ， 相 比 传统 决策 树 方 
法 ， 能 快速 收 僵 、 有 效 克 服 过 拟 合 ， 对 于 非 线 性 
非 平稳 长 时 序数 据 的 预测 具有 较 高 精度 ， 在 训练 
速度 、 泛 化 能 力 和 预测 能 力 上 具有 优势 ””。 
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2.2.3 ”长 短 时 记忆 神经 网 络 (LSTM ) 

LSTM 是 由 Hochreiter 等 在 循环 神经 网 络 
(Recurrent Neural Networks, RNN) 基础 上 提出 
的 神经 网 络 模型 ”2 25 。 

LSTM 模型 采用 细胞 状态 和 3 个 门 结构 替换 
RNN 隐 含 层 神经 元 ， 实 现 了 去 除 或 增加 控制 信 
息 在 细胞 状态 的 能 力 ， 殉 服 了 RNN 梯度 消失 、 
学 习 能 力 下 降 、 信 息 长 期 依赖 等 问题 OY, 

LSTM 中 使 用 输入 门 和 遗忘 门 来 控制 单元 状 
态 向 后 传递 的 信息 ; 输出 门 控制 单元 状态 用 于 输 
出 LSTM 的 当前 值 ， 如 下 : 

i,= o(WIh,. sat + b,) 

f= 9(WLh,_1.x,] + b,) 

C,= fC, + i{tanh(WL[h,_,,.x,]+b.)) 4 
0,= o(W[h,- | + b,) 

h,= o,tanh(C,) 

其 中 , i, 人 o、C 分 别 代表 输入 门 、 遗 忘 
门 、 输 出 门 以 及 候选 向 量 ; WINE; 2 为 偏 置 
o (.) X sigmoid vais phi BL; tanh (.) 为 双 曲 正 
切 激活 函数 ; i. f on CIMERMAN, 、 遗 


忘 门 、 输 出 门 以 及 1 时 刻 的 候选 向 量 更 新 值 ;WW. 


和 bb. 代 表 候选 向 量 C 的 权重 和 偏 置 ; x 为 1 时 刻 序 
列 输入 ,有 为 时刻 的 输出 。 


3 基于 EMD-RF-LSTM 的 组 合 预 
测 模型 设计 


3.1 模型 设计 


为 解决 非 线性 时 序列 数据 经 验 模 态 分 解 后 不 
同 频 域 模 态 分 量 预测 精度 不 佳 的 问题 ， 验 证 按 
高 、 低 频 分 量 分 别 预测 的 效果 ， 本 研究 设计 了 基 
于 EMD-RF-LSTM 的 对 是 养殖 水 体 溶解 氧 组 合 预 
测 模 型 ， 并 选用 溶解 氧 浓度 数据 作为 输入 。 首 先 
采用 EMD 对 呈现 周期 波动 的 、 非 线性 的 对 是 养 
殖 溶解 氧 时 间 序 列 数 据 进 行 多 尺度 分 解 ， 划 分 成 
高 频 IMF、 低 频 IMF 及 残 差 值 RES; 然后 对 分 解 
后 数据 进行 归 一 化 处 理 ， 划 分 训练 集 和 测试 集 ; 


使 用 低频 分 量 训练 REF 模型 ， 高 频 分 量 训 练 
LSTM 模 型 ， 并 用 Adam 反 复 优 化 调整 LSTM 模 
型 参数 ; 最 后 ， 将 测试 集 用 于 该 模型 评估 ， 并 展 
开 与 ELM、RF、LSTM 等 标准 模型 及 采用 EMD 
分 解 模型 的 对 比试 验 ， 以 验证 本 研究 模型 对 对 是 
养殖 水 体 浴 解 氧 的 预测 性 能 。 详 细 步 又 如 下 。 

(1) 通过 水 质 检测 传感器 采集 溶解 氧 时 间 序 
列 数 据 ， 完 成 预 处 理 ; 

(2) 对 预 处 理 后 溶解 氧 时 序数 据 进 行 EMD 
分 解 ， 得 到 不 同 频 率 IMF 分 量 ， 并 归 一 化 处 理 ; 

(3) 将 归 一 化 处 理 后 的 对 是 养殖 溶解 氧 IMF 
分 量 分 为 高 频 和 低频 ， 并 划分 训练 集 和 测试 集 ; 

(4) 对 IMF 高 频 分 量 、 低 频 分 量 及 余 量 ， 分 
别 建立 LSTM 及 RF 模型 ， 对 预测 模型 参数 和 权 
重 进行 初始 化 ; 

(5) 将 训练 集 作为 输入 对 模型 进行 训练 ， 对 
LSTM 模型 参数 及 权重 进行 迭代 优化 处 理 ， 完 成 
基于 EMD-RF-LSTM 的 对 虾 养殖 溶解 氧 预 测 模型 
构建 ; 

(6) 测试 预测 模型 ， 并 与 其 它 模 型 对 比 。 

所 构建 的 预测 模型 如 图 2 所 示 。 

开始 
WYER IER 
数据 修复 与 归 一 化 预 处 理 


sea 


ES 

Y 
IMF 分 量 归 一 化 

v 
氏 频 IMEF | |…| | 高 频 IMF 


Yy v v 
REF 模型 ||…| |LSTM 模 型 


vy vy 
预测 结果 1 | |…| | 预测 结果 n 


y 
AIRA 


y 
反 归 一 化 


溶解 氧 预测 结果 输出 


图 2 基于 EMD-RF-LSTM 的 对 是 养殖 溶解 氧 预 测 模 型 
Fig. 2 Flowchart of dissolved oxygen prediction model 


based on EMD-RF-LSTM 
3.2 评价 指标 


为 验证 EMD-RF-LSTM 模 型 对 对 是 养殖 水 体 
溶解 氧 浓度 的 预测 性 能 ， 展 开 了 本 模型 与 其 它 模 
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型 的 对 比试 验 。 选 择 了 平均 绝对 百分比 误差 
(MAPE) 、 均 方 根 误差 (RMSE) 和 平均 绝对 误 
22 (MAE) 三 项 评价 指标 对 组 合 模型 的 预测 性 
能 进行 性 能 评价 ， 并 开展 对 比 。 


4 试验 及 结果 分 析 


4.1 数据 预 处 理 


试验 以 湛江 市 南 三 岛 对 是 养殖 基地 试验 池塘 
溶解 氧 浓度 为 研究 对 象 ， 以 基于 物 联网 数据 采集 
模块 采集 的 对 是 养殖 水 质数 据 作 为 试验 样本 。 选 
取 2020 年 7 月 20 日 至 8 月 20 日 采集 的 共计 1488 
个 样本 加 入 试验 用 数据 集 ， 并 取 前 1344 条 数据 
作为 训练 集 ， 最 后 144 条 数据 作为 测试 集 。 图 3 
显示 了 完整 数据 采集 周期 的 原始 数据 ， 其 中 横 坐 
标 为 每 30 min 间隔 采集 的 数据 序列 ， 纵 坐标 为 深 
解 氧 浓度 数值 。 由 图 3 可见 ， 真 实 对 虾 养殖 现场 
水 体 溶 解 氧 浓度 时 序数 据 呈现 显著 周期 性 、 非 线 

性 特征 。 
i 


| 
| lL | | 


0 200 400 600 800 1000 1200 1400 


溶解 氧 / (mg*L-!) 
三 
一 
gm 


图 3 溶解 氧 原 始 数据 变化 曲线 图 
Fig.3 Variation curve of the original air oxygen data 
针对 水 质 传感器 故障 等 因素 导致 的 采集 数据 
异常 ， 利 用 均值 平滑 法 进行 处 理 。 如 果 存 在 参数 
与 其 平均 值 之 差 的 绝对 值 大 于 其 标准 差 的 3 售 ， 
即 断 定 为 异常 值 并 用 其 两 侧 数 据 的 平均 值 蔡 换 ， 
如 公式 (5) 所 示 。 
P,- P|> 36, 
P +P， (5) 
2 
其 中 ，P, 为 1 时 刻 溶解 氧 参 数 采集 值 ; P, 为 


Pi= 


异常 数据 处 理 后 值 ; P 为 水 体 溶 解 氧 数据 序列 
均值 。 

为 提高 预测 准确 率 减少 误差 ,便于 研究 对 是 
养殖 溶解 氧 浓度 数据 间 的 相关 性 ， 更 好 地 提取 时 
序数 据 信 息 ， 本 研究 利用 公式 (6) 对 数据 进行 


归 一 化 处 理 。 
we. N = N an 
= Noga — Nevin (6) 


其 中 ，N ,为 溶解 氧 浓度 最 大 值 ，N, ,为 最 小 
值 ， 单 位 mg/L; N 为 归 一 化 值 。 


4.2 开发 环境 及 工具 选择 


试验 计算 机 环境 为 Intel 17-7700K CPU, 
8GB 内 存 Window7 + python3.7 + MATLAB, 
集成 开发 环境 为 Anaconda3 。 

其 中 ，EMD 和 ELM 模 型 基于 MATLAB 工具 
箱 实 现 ，RF 模 型 基于 Anaconda 的 Sklearn 程 序 包 
实现 ，LSTM 模型 基于 Keras 框架 构建 ， 试 验 参 
数 采 用 留 一 法 交叉 验证 网 格 搜索 法 (Leave-One- 
Out-Cross-Validation, LOOCV) 优化 。 


4.3 基于 EMD 的 溶解 氧 多 尺度 分 解 

为 得 到 更 加 准确 的 预测 效果 ， 获 得 高 精度 的 
对 是 养殖 溶解 氧 时 序 分 量 ， 本 研究 首先 使 用 
EMD 对 原始 溶解 氧 时 序数 据 进行 多 尺度 分 解 ， 
分 解 后 得 到 的 分 量 如 图 4 所 示 。 


0 200 400 600 800 1000 1200 1400 
样本 数 / 个 
(a)IMF1 分 量 


0 200 400 600 800 1000 1200 1400 
样本 数 / 个 


(b)IMEF2 分 量 
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0 200 400 60 800 1000 1200 1400 
样本 数 / 个 


(c)IMF3 分 量 
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(d)IMF4 分 量 
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(e)IMF5 分 量 
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(f)IMF6 分量 
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图 4 基于 EMD 的 原始 溶解 氧 多 尺度 分 解 
Fig. 4 Multi-scale decomposition of original dissolved oxy- 
gen based on EMD 

由 图 4 可 以 看 出 ， 对 是 养殖 水 体 溶 解 氧 浓 度 
时 序数 据 不 同 尺度 的 特征 明显 ， 分 解 后 得 到 的 本 
征 模 态 分 量 IMF1 一 IMF7 各 表现 出 不 同 的 信息 特 
征 ， 最 后 的 剩余 分 量 序列 平稳 ， 体 现 出 对 是 养殖 
水 体 溶解 氧 总 体 含量 的 长 期 变化 状态 。 


4.4 IMF 分 量 预测 及 参数 设置 


基于 文献 [25], [30] 和 [31] ， 本 研究 在 
经 验 模 态 分 解 的 基础 上 ， 采 用 全 面试 验方 法 利用 
LSTM 模 型 和 RF 模型 分 别 对 IMF1 一 IMF7 及 RES 
分 量 进行 建 模 训练 ， 并 使 用 扩展 随机 梯度 下 降 法 
对 LSTM 模 型 参数 进行 优化 ， 利 用 网 格 搜 索 法 对 
RF 模型 参数 进行 优化 ， 以 寻找 LSTM 和 RF 模型 
在 不 同 频 度 分 量 上 的 预测 表现 。 

标准 LSTM 隐 含 层 节 点 数 、 批 尺度 和 时 间 步 
分 别 为 20、32 和 5，RF 模 型 的 参数 学 习 率 为 0.1， 
节点 数 深度 为 3， 节 点 数 颗 数 为 500， 最 小 叶子 
权重 为 6。 得 到 各 个 IMF 分 量 和 RES 分量 的 
LSTM 模 型 和 RF 模型 预测 结果 分 别 如 表 1 和 表 2 
所 示 。 


表 1 各 分 量 LSTM 预测 结果 精度 分 析 


Table 1 Forecast results for each sub sequence of LSTM 


分 量 MAPE RMSE MAE 
IMF1 0.8097 0.2911 0.2350 
IMF2 0.1397 0.4436 0.1687 
IMF3 0.0100 0.0543 0.0449 
IMF4 0.0082 0.0880 0.0435 
IMF5 0.0185 0.1298 0.1424 
IMF6 0.0206 0.0176 0.0170 
IMF7 0.0033 0.0080 0.0080 

Rn 0.0101 0.0353 0.0331 


YE: Rn 为 残余 分 量 
表 2 各 分 量 RF 预测 结果 精度 分 析 


Table 2 Forecast results for each sub sequence of RF 


分 量 MAPE RMSE MAE 
IMF1 1.1542 0.3802 0.3268 
IMF2 0.1218 0.0952 0.0604 
IMF3 0.0118 0.0520 0.0421 
IMF4 0.0154 0.0796 0.0524 
IMF5 0.0044 0.0234 0.0194 
IMF6 0.0007 0.0004 0.0003 
IMF7 0.0045 0.0099 0.0084 

Rn 0.0097 0.0253 0.0249 


由 表 1 和 表 2 可 见 ，RF 模 型 对 高 频 分 量 
IMF1 的 MA4PE 值 仅 为 1.1542， 对 IMF4 的 MAPE 
值 为 0.0154， 均 低 于 LSTM 对 应 分 量 的 预测 精 
度 。 但 随 着 各 分 量 频率 降低 ，RF 模型 的 预测 精 
度 也 随 之 提高 ;此 时 随 着 分 量 频率 降低 ，LSTM 
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模型 预测 精度 呈现 下 降 趋 势 。 两 者 相对 比 发 现 ， 
在 高 频 分 量 IMF1 一 IMF4 的 预测 精度 上 ，LSTM 
模型 在 关键 指标 上 优 于 RF 模型 ， 而 RF 模型 则 在 
低频 分 量 上 表现 更 好 ,试验 结果 符合 预期 。 由 此 
结果 可 知 ， 低 频 分 量 适合 训练 RE 模型 ， 高 频 分 
量 适合 训练 LSTM 模型 。 


4.5 基于 EMD-RF-LSTM 的 组 合 预测 


依据 4.4 节 试验 展现 特点 ， 采 用 LSTM 和 RF 
模型 分 别 对 高 频 分 量 (IMF1 一 IMF4)、 低 频 分 量 


MIR% (IMF5 一 IMF7，Rn) 进行 建 模 ， 然 后 将 
各 分 量 预测 结果 求 和 ， 以 实现 基于 EMD-RF- 
LSTM 的 对 虾 养殖 溶解 氧 浓度 预测 。 

为 验证 模型 性 能 ， 分 别 采 用 标准 模型 、 模 态 
分 解 后 模型 以 及 本 研究 模型 ， 使 用 相同 数据 集 开 
展 溶 解 氧 浓度 预测 。 其 中 标准 ELM 模 型 采用 sig- 
moid 激 活 函 数 ， 隐 含 层 节点 数 为 8。 不 同 模型 的 
溶解 氧 浓度 预测 结果 如 图 5 所 示 ， 各 指标 如 表 3 
所 示 。 


ao 一 实际 值 。 ”人 一 实际 值 。 一 实际 值 。 一 实际 值 
20 一 预测 值 h 20 一 预测 值 aw 一 预测 值 4) 20 一 预测 值 
op op èn op 
& 15 E15 E15 E15 
- 10 E 10 D 10 < 10 
E E. w E. 
Š 5 => = 5 => 
any = 0 = 1 a o, # a 

0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140 

数据 点 /个 数据 点 /个 数据 点 /个 数据 点 /个 
(a) ELM 模 型 (b) RF 模型 (c) LSTM 模 型 (d) EMD-ELM 模 型 

Ps 一 实际 值 an 一 实际 什 a 一 Seta 

1 20 一 预测 值 = 20 一 预测 值 T 20 一 预测 值 

op bp bp 

E15 E15 E15 

È 0 R 10 3 10 

ee E E. 

5 Bs 5 & 5 

5% 0 ia 0 x 

0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140 0 20 40 60 80 100 120 140 
数据 点 /个 数据 点 /个 数据 点 /个 
(e) EMD-RF 模 型 (© EMD-LSTM 模 型 (g) EMD-RF-LSTM 模 型 


AS 7 种 模型 的 溶解 氧 浓度 预测 结 


Fig.5 Oxygen forecasting results of the seven models 


表 3 7 种 模型 预测 结果 精度 


Table 3 Forecast results for the seven models 


序号 模型 MAPE RMSE MAE 
1 ELM 0.1159 0.6969 0.5824 
2 RF 0.1027 0.7585 0.5823 
3 LSTM 0.1021 0.6794 0.5070 
4 EMD-ELM 0.0810 0.4906 0.3905 
5 EMD-RF 0.0304 0.3803 0.2467 
6 EMD-LSTM 0.0257 0.3173 0.2113 
7 EMD-RF-LSTM 0.0129 0.1156 0.0844 


4.6 结果 分 析 


4.6.1 经 验 模 态 分 解 (EMD ) 分 析 

对 试验 结果 进行 分 析 统 计 ， 在 相同 对 是 养殖 
溶解 氧 浓 度数 据 集 下 : EMD-ELM 模型 与 标准 
ELM #& #2 %¢ LE, MAPE, RMSE Ñ MAE KERANI] 


降低 了 30.11%., 29.60% 和 32.95%; EMD-RF 
与 标准 RF BE AY XT LL, MAPE, RMSE 和 MAE 
指标 分 别 降低 了 70.40% . 49.86% 和 57.63% ; 
EMD-LSTM 与 标准 LSTM XT EK, MAPE, RMSE 
FI MAE 指标 分 别 降低 了 74.83%、53.30% 和 
58.32%, 

以 关键 精度 指标 MA4PE 为 例 ， 采 用 EMD 分 
解 ELM、RF 和 LSTM 模 型 相 比 对 应 标准 模型 分 
别 降低 了 30.11%、70.40% 和 74.83%， 预 测 精 度 
显著 高 于 标准 模型 ， 证 明基 于 EMD 的 时 序数 据 
多 尺度 分 解 可 有 效 提 升 预测 性 能 。 
46.2 ”多 频 度 模 态 分 量 组 合 预测 分 析 

由 试验 结果 可 知 ， 在 相同 数据 集 下 ， 在 经 验 
模 态 分 解 (EMD) 基础 上 通过 RF 和 LSTM 对 不 
同 特征 尺度 的 本 征 模 态 分 量 分 别 预测 的 EMD- 
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RF-LSTM 模 型 与 4.6.1 中 EMD 分 解 后 的 各 模型 对 
比 。 以 关键 精度 指标 MA4PE 为 例 ， 本 研究 提出 的 
基于 多 频 模 态 分 量 组 合 预测 模型 ， 较 普通 EMD 
分 解 后 模型 分 别 降低 了 84.07%、57.57% 和 
49.81%， 预 测 精度 显著 提高 ， 证 明 针 对 多 频 分 量 
的 预测 策略 可 提升 模型 性 能 。 

4.6.3 ”基于 EMD-RF-LSTM 组 合 预测 模型 分 析 

对 预测 结果 分 析 可 发 现 ， 经 验 模 态 分 解 具备 
多 尺度 提取 对 是 养殖 溶解 氧 时 间 序 列 信息 的 特 
性 ， 数 据 分 解 之 后 会 在 保留 原始 信息 基础 上 得 到 
更 多 的 本 征 模 态 系数 时 间 序 列 信 号 ; 而 RF 可 有 
效 提取 低频 IMF 数据 信息 ，LSTM 模 型 对 高 频数 
据 有 理想 的 效果 ， 对 于 时 间 序 列 信息 能 够 高 效 
利用 。 

本 研究 提出 的 基于 EMD-RF-LSTM 组 合 模型 
结合 了 经 验 模 态 分 解 的 多 尺度 特征 提取 、LSTM 
对 长 时 间 序 列 高 频数 据 预测 以 及 RF 算法 对 低频 
IMF 数 据 信息 提取 的 优势 ， 能 获得 较 高 的 对 虾 养 
殖 水 体 溶 解 氧 浓度 预测 精度 ， 预 测 曲线 能 够 很 好 
地 拟 合 养殖 溶解 氧 浓 度 非 线性 时 间 序 列 变化 趋 
势 ， 取 得 很 好 的 预测 效果 。 


5 讨论 与 结论 


5.1 讨论 


在 对 对 是 养殖 水 质 长 期 检测 数据 的 观察 中 发 
现 ， 养 殖 水 质 尤 其 是 溶解 氧 (DO) 浓度 变化 相 


预测 效果 不 佳 ; 而 文献 [31] 为 验证 训练 样本 较 
少 的 训练 效果 ， 为 提出 的 EMD-LSTM 模型 选择 
了 1500 组 数据 作为 训练 样本 ， 并 获得 较 好 预测 
效果 。 综 上 ， 本 研究 综合 考虑 变量 数量 、 总 体 样 
本 量 比例 关系 ， 为 验证 本 研究 提出 EMD-RF- 
LSTM 模型 在 训练 样本 较 少 情况 下 的 表现 ， 从 现 
场 数据 中 选择 了 采集 周期 为 一 个 月 、 采 样 间隔 为 
30 min、 共 计 1488 组 溶解 氧 浓度 时 序数 据 作为 训 
练 样本 开展 研究 。 

本 研究 在 选择 训练 样本 较 少 的 情况 下 ， 首 先 
验证 LSTM 在 经 验 模 式 分 解 后 的 低频 分 量 上 预测 
效果 不 佳 的 情况 ， 然 后 通过 试验 结果 将 IMF 1— 
IMF4 划分 为 适合 LSTM 模型 训练 的 高 频 分 量 ， 
将 IMF5 一 IMF7 及 Rn 划分 为 适合 RF 模型 训练 的 
分 量 ， 并 构建 了 EMD-RF-LSTM 组合 模 型 以 提升 
预测 精度 。 此 外 ， 本 人 研究 利用 历史 数据 进行 交叉 
验证 ， 模 型 展现 了 较 好 预测 结果 ， 为 进一步 验证 
在 训练 样本 较 少 时 历史 数据 的 影响 ， 在 后 续 试 验 
中 将 加 入 实际 现场 测试 结果 对 本 模型 性 能 进行 验 
证 ; 并 调整 可 能 会 引起 溶 氧 剧 烈 变 化 的 时 刻 的 采 
样 频率 ， 如 投 饵 时 ， 或 早晚 ， 或 天 气 变化 时 ， 调 
整 采样 间隔 。 

5.2 结论 


本 研究 针对 对 是 养殖 水 体 溶解 氧 浓度 采集 数 
据 不 稳定 和 多 尺度 特征 等 特点 ， 分 析 了 训练 样本 
较 少 情况 下 非 线性 时 序列 数据 经 验 模 态 分 解 后 不 


对 缓慢 ， 在 文献 [7] 和 [12] 中 均 可 见 溶解 氧 
浓度 在 30 min 内 变化 很 小 。 相 对 于 文献 [30] 中 
数据 采集 周期 、 采 集 间 隔 及 训练 数据 量 ， 本 研究 
在 检测 周期 同 为 一 个 月 的 情况 下 ， 适 当 增 大 了 数 
据 采 集 间隔 ， 以 减少 用 于 训练 的 总 样本 数量 。 由 
于 LSTM 作为 一 种 时 间 循 环 神经 网 络 是 为 解决 
RNN 存 在 长 期 依赖 问题 而 设计 ， 对 于 时 间 序 列 
数据 有 较 好 的 记忆 能 力 ， 对 于 长 度 较 短 的 时 间 序 
列 数据 也 具有 一 定 预测 效果 。 在 文献 [25] F, 
LSTM 模 型 在 经 验 模式 分 解 后 的 高 频 分 量 上 预测 
效果 表现 优异 ， 而 在 训练 样本 较 少 的 低频 分 量 上 


同 频 域 模 态 分 量 预测 精度 不 佳 的 问题 ， 利 用 
EMD 对 对 虾 水 质 溶解 氧 浓 度数 据 进 行 多 尺度 分 
解 ， 使 用 LSTM 用 于 高 频 分 量 预测 RF 用 于 低 
频 分 量 预测 ， 对 不 同 频 段 数据 分 量 进行 分 别 建 模 
预测 ， 通 过 真实 养殖 环境 数据 试验 证 明 ， 本 研究 
提出 基于 EMD-RF-LSTM 的 组 合 预测 模型 的 
MAPE、RMSE 和 MAE 指标 分 别 为 0.0129、 
0.1156 和 0.0844， 与 经 验 模式 分 解 后 的 EMD- 
ELM、EMD-RF 和 EMD-LSTM 模型 相 比 关键 指 
标 M4PE 分 别 降 低 了 84.07%、57.57% 和 49.81%, 
在 训练 样本 较 少 的 情况 下 对 于 对 是 养殖 水 体 溶解 
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氧 浓度 具有 良好 的 预测 效果 ， 有 效 提 高 了 预测 精 
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Abstract: Dissolved oxygen is an important environmental factor for prawn breeding. In order to improve the prediction accura- 
cy of dissolved oxygen concentration in prawn pond, and solve the problem of low prediction accuracy of different frequency 
domain modal classification after empirical modal decomposition of nonlinear time series data when there are few training sam- 
ples, an combination prediction model based on empirical mode decomposition (EMD), random forest (RF) and long short term 
memory neural network (LSTM) was proposed in this research. Firstly, the time series data of prawn breeding dissolved oxygen 
concentration were decomposed at multiple scales by EMD to obtain a set of stationary intrinsic mode function (IMF). Second- 
ly, with fewer training samples, poor predicts effects on the low-frequency were verified component by LSTM. Then, IMF1— 
IMF4 were divided into high-frequency components through test results and used for LSTM model. IMF5—IMEF7, Rn were di- 
vided for RF model, the EMD-RF-LSTM combination model was constructed to improve the prediction accuracy. Modeled low- 
frequency and high-frequency components IMF using RF and LSTM, then predictions of each component were accumulated 
and the prediction value of dissolved oxygen of sequence data were got. Finally, the performance of the model was compared 
with the limit learning machine (ELM), RF, standard LSTM, EMD-ELM and EMD-RF, EMD-LSTM, etc. In the test based on 
real dataset, the EMD-ELM model contrasted with ELM model, reduced the mean absolute error (MAPE), root mean square er- 
ror (RMSE) and mean absolute error (MAE) by 30.11%, 29.60% and 32.95%, respectively. The MAPE, RMSE, MAE for the pro- 
posed models were 0.0129, 0.1156, 0.0844, respectively. MAPE decreased by 84.07%, 57.57%, and 49.81% compared with 
EMD-ELM, EMD-RF and EMD-LSTM, respectively, the prediction accuracy was significantly improved. The results show that 
the proposed model EMD-RF-LSTM has good prediction performance and generalization ability, which is meets the actual de- 
mand of accurate prediction of dissolved oxygen concentration in prawn culture, and can provide reference for the prediction 
and early warning of prawn pond water quality. 

Key words: prawn pond; dissolved oxygen prediction; empirical mode decomposition; random forest; short and long-term mem- 
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